崖 壁 植物 太行 菊 与 长 裂 太 行 菊 全 基因 组 大 小 及 特征 分 析 
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摘要 : 太行 菊 COpisthopappus taihangensis) ~ KRRIT% COpisthopappus longilobus) ， 
为 太行 山特 有 多 年 生 岸 壁 草本 植物 ， 菊 科 (Compositae) 重要 野生 资源 ， 具 有 较 高 的 经 
济 与 生态 价值 。 为 确定 适合 两 物种 的 全 基因 组 测序 策略 ， 本 研究 利用 流 式 细胞 法 和 高 通 
量 测序 技术 ， 分 析 两 物种 基因 组 大 小 、 杂 合 率 、 重 复 序列 及 GC 含量 等 信息 。 结 果 表 明 : 
(1) 流 式 细胞 法 估算 太行 菊 基 因 组 大 小 为 2.1 Gb, 长 裂 太 行 菊 基 因 组 大 小 2.4 Gb; (2) 
高 通 量 测序 修正 后 太行 菊 基 因 组 大 小 为 3.13 Gb， 重 复 序列 比例 为 84.35 %， 杂 合 度 为 
0.99 %，GC REN 36.56 %; 长 裂 太 行 菊 基因 组 为 3.18 Gb， 重 复 序列 比例 为 83.83 %， 
杂 合 度 为 1.17 %，GC 含量 为 36.62 %; (3) 初步 组 装 后 GC 含量 分 布 及 平均 深度 存在 
和 常 ， 出 现 分 层 现象 , 可 能 是 两 物种 基因 组 杂 合 率 较 高 所 致 。 从 基因 组 结构 看 ,太行 菊 、 
长 裂 太 行 菊 均 属 于 高 重复 、 高 杂 合 、 大 基因 组 的 复杂 基因 组 , 建议 使 用 Tllumina + PacBio 
测序 组 装 策略 ， 进 行 全 基因 组 测序 分 析 。 
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Genome sizes and characteristics of cliff plants 
Opisthopappus taihangensis and O. longilobus on the 
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Abstract: Opisthopappus taihangensis and O. longilobus, being perennial cliff herbs and 
endemic on the Taihang Mountains, an important wild germplasm resource of Compositae, 
have high economic and ecological values. To determine the appropriate sequencing strategy 
for the whole genome of O. taihangensis and O. longilobus, in this study, the genome sizes, 
heterozygosity, GC content, and repeatability were analyzed through the flow 
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cytometry and high-throughput sequencing methods. The results were as follows: (1) Using 
maize of known genome size as controls, the genome size of O. taihangensis was 
approximately 2.1 Gb, while that of O. longilobus was approximately 2.4 Gb; (2) For O. 
taihangensis, the revised genome size was 3.13 Gb, and the repetitive sequences proportion, 
heterozygosity and GC content in the whole genome were estimated to be 84.35 96, 0.99 94 
and 36.56 % respectively. Within O. longilobus, the revised genome size, the proportion of 
repetitive sequences, heterozygosity and GC content were 3.18 Gb, 83.83 96, 1.17 % and 
36.62 % respectively; (3) The initial depth and content distribution of GC appeared abnormal 
after initial assembly, which might be related to the relatively high heterozygous rate of the 
two species. Above all, the whole genome of O. taihangensis and O. longilobus both were a 
large and complex genome with high heterozygosity and repetitiveness. Therefore, it suggests 
that the use of Illumina + PacBio sequencing assembly strategy for the whole genome 
sequencing analysis of two Opisthopappus species in the future. 
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随 着 第 二 代 高 通 量 测序 技术 Cnext-generation sequencing technology) 和 第 三 代 单 分 
子 测 序 技术 (single-molecule sequencing) 的 发 展 与 成 熟 ， 测 序 的 时 间 成 本 不 断 降 低 ， 为 
不 同 物种 基因 组 测序 提供 了 条 件 和 便利 (Aird et al., 2011; 施 季 森 等 , 2012; Li et al., 2019). 
而 物种 全 基因 组 测定 可 为 其 基因 组 学 和 进化 生物 学 领域 研究 提供 线索 参考 , 为 其 分 子 生 
物 学 、 转 录 组 学 、 生 物 信息 学 研究 黄 定 基础 。 从 基因 组 水 平 出 发 ， 分 析 植 物 物种 的 生长 、 
适应 、 进 化 等 问题 ， 可 很 好 促进 对 植物 的 进一步 认识 ， 同 时 加 快 新 基因 的 发 现 、 挖 掘 与 
利用 (Bietal,2019; 李江 莹 等 , 2020; 赵 乐 等 , 2021) 。 但 在 大 规模 实施 深度 测序 之 前 ， 
有 必要 进行 基因 组 Survey， 通 过 Survey 判断 植物 物种 基因 组 大 小 及 复杂 程度 ， 提 前 了 
解 植 物 基因 组 基本 情况 ,减少 测序 盲目 性 , 并 据 此 选取 合适 测序 策略 和 序列 拼接 软件 ( 唐 
3.55,2015; 1ETHÉRAS, 2018; Bietal,2019; Lietal,2019; Jof, 2020) 。 

太行 萄 COpisthopappus taihangensis) 与 长 裂 太行 菊 〈O. longilobus) 均 为 太行 菊 属 

COpisthopappus) 多 年 生 草 本 植物 ， 仅 生长 在 太行 山 的 悬崖 裂 颖 中 ， 典 型 的 崖 壁 植物 ， 
具有 良好 的 抗旱 抗 寒 性 (Chai etal., 2018, 2020) 。 作 为 二 倍 体 植 物 (2n=18) ， 太 行 菊 、 
长 裂 太 行 菊 是 菊 亚 族 (Chrysantheminae〉 中 较为 原始 的 物种 (Ye et al.,2021) , Sf 
(Compositae) 重要 的 野生 种 质 资源 ， 其 体内 可 能 含有 如 耐寒 耐 旱 等 方面 的 大 量 优异 基 
因 ， 是 菊 科 种 质 创 新 的 良好 基因 源 。 然 而 太行 菊 、 长 裂 太 行 菊 全 基因 组 大 小 以 及 基因 组 
特征 等 信息 较为 缺乏 ， 阻碍 其 基因 组 测序 工作 的 进一步 开展 ， 也 不 利于 其 进化 生物 学 等 
相关 工作 的 研究 〈 霍 恺 森 等 , 2018) )。 因 此 ， 开 展 太 行 菊 与 长 裂 太行 菊 全 基因 组 的 测 
序 工作 十 分 必要 ， 这 将 从 分 子 水 平 揭示 其 适应 、 演 化 、 抗 性 等 机 理 ， 并 为 其 经 济 价 值 的 
综合 合理 利用 提供 科学 理论 支持 ( 宋 立 肖 等 , 2018) 。 

自 模式 植物 拟 南 芥 (4rabidopsis thaliana) 的 全 基因 组 公布 以 来 ， 已 有 400 多 种 植 
物 的 基因 组 被 测序 (Chen et al., 2018, 2019; https://www.plabipd.de/index.ep) ， 而 且 目 前 
还 有 许多 植物 物种 正在 测序 ， 这 为 研究 植物 全 基因 组 测序 提供 了 大 量 的 参考 信息 ， 特 别 
是 同属 菊 科 管状 花 亚 科 CCarduoideae) WE (Artemisia annua) (Shen etal., 2018) ~ 
EF% (Chrysanthemum nankingense) (Song etal., 2018) 、 太 阳 花 (Helianthus annuus) 

(Badouin et al., 2017) 、 小 甘草 (Conyza canadensis) (Peng etal., 2014) . WI ezéfgj 
(Cynara cardunculus) (Scaglione et al., 2016) 全 基因 组 的 完成 ， 对 于 太行 菊 、 长 裂 太 
行 菊 基 因 组 的 解析 具有 重要 的 借鉴 作用 。 
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在 系统 关系 上 ， 太 行 菊 属 与 菊 属 (Dendranthema) 、 亚 菊 属 CAjania) 的 大 部 分 类 


群 组 成 菊 属 群 , 其 位 置 更 接近 于 万 亚 族 (Artemiisinae ) ( 赵 宏 波 等 , 2010; Zhao et al., 2010)。 


[E] JJ: MEI (Oberprieler et al., 2007) 的 菊 属 植物 野 菊 和 芒 属 植物 青 萝 ， 其 基因 组 均 为 
高 重复 、 高 杂 合 、 大 基因 组 的 复杂 基因 组 (Shen et al., 2018; Song et al., 2018) ， 而 与 其 
系统 关系 相近 的 太行 菊 属 两 物种 的 基因 组 如 何 ? 是 否 呈 现 出 相似 的 基因 组 特征 ? 

为 此 ， 本 研究 通过 流 式 细胞 法 (Arumuganathan & Earle, 1991; Doležel et al., 2007) 
和 高 通 量 测序 技术 ， 拟 解决 以 下 问题 CD 预 估 太 行 菊 与 长 裂 太 行 菊 基 因 组 大 小 ; (2) 测 
定 、 评 估 两 物种 全 基因 组 大 小 和 特点 。 研 究 结果 旨 在 全 面 了 解 太 行 菊 与 长 裂 太 行 菊 基因 
组 特征 ， 为 后 续 其 全 基因 组 de novo 测序 及 组 装 策略 提供 依据 ， 为 挖掘 其 抗旱 抗 寒 基 医 
及 利用 其 潜在 的 基因 资源 提供 线索 (EIERE, 2018) . 


1 材料 与 方法 
1.1 材料 

2019 年 10 月 ， 从 山西 王莽 岭 (太行 菊生 长 点 ) 和 壶 关 【〈 长 裂 太行 菊 生长 点 ) 收集 太行 
菊 和 长 裂 太 行 菊 的 种 子 并 带 回 实验 室 ， 于 2020 年 1 月 在 实验 室 进 行 萌发 ， 然 后 盆栽 培养 。6 
挑选 长 势 良 好 的 健康 个 体 (每 个 物种 3 个 个 体 )， 选取 完整 叶片 , 液 氮 速冻 后 , 置 于 -80 C 
超低温 冰箱 中 保存 备用 〈 宋 立 肖 等 , 2018) 
1.2 流 式 细胞 法 检测 
各 取 两 物种 0.5 cm 叶片 ， 将 其 放 在 平底 培养 焉 中， 加 入 400 hl 提取 OTTO 缓冲 液 ， 用 
刀片 垂直 把 叶片 切 碎 ， 持 续 30~60 s。 室 温和 下， 孵育 30~90 s， 然 后 过 滤器 过 滤 ， 加 入 1.6 ml 
染色 溶液 (染色 缓冲 液 +PI+RNase 储存 液 ) ， 避 光 室 温 ， 孵 育 30~60 min。 最 后 在 Sysmex 
CyFlow® Cube6 流 式 细 胞 仪 上 进行 检测 。 

将 已 知 基 因 组 大 小 的 玉米 〈 大 小 约 2.3 Gb) 作为 对 照样 品 ， 首 先 将 玉米 、 太 行 菊 、 长 裂 
太行 菊 单 独 测定 ， 检 测 每 个 样品 的 相对 荧光 强度 ; 然后 以 玉米 为 对 照 ， 对 玉米 与 太行 菊 、 玉 
米 与 长 裂 太 行 菊 的 混合 样品 进行 相对 交 光 强度 的 检测 。 根据 不 同样 品 相对 荧光 强度 峰值 ， 参 
考 对 照样 品 的 基因 组 ， 佑 算 太 行 菊 、 长 裂 太 行 菊 的 基因 组 大 小 。 
1.3 基因 组 Survey 分 析 
1.3.1 DNA 提取 

用 改良 CTAB 法 对 太行 菊 、 长 裂 太行 菊 叶片 基因 组 DNA 进行 提取 。 随 后 用 分 光 光 度 计 
和 琼脂 糖 凝 胶 电泳 分 别 对 提取 的 DNA. 纯度 、 浓 度 和 完整 性 进行 检测 〈 赵 乐 等 , 20200 
1.3.2 样品 测序 

将 太行 菊 、 长 裂 太 行 菊 〈 各 3 个 样品 ) 的 DNA 样品 委托 杭州 联 川 生物 公司 进行 测序 。 
通过 Covaris 超声 波 破碎 仪 ， 随 机 打 断 成 片段 ， 经 末端 修复 -加 A 尾 -加 测序 接头 -纯化 -PCR 
扩 增 等 完成 整个 文库 制备 。 构 建 好 的 文库 通过 Numina Hiseq 进行 PE( 双 末端 ，Pair-end) 
测序 


测序 得 到 的 原始 序列 , 含有 低 质量 带 接头 的 reads, 会 对 后 续 分 析 带 来 影响 , 对 raw reads 
进行 精细 过 滤 ， 得 到 clean reads， 用 于 后 续 基 因 组 大 小 、 杂 合 度 、GC 含量 等 分 析 。 以 Q20、 
Q30 作为 衡量 测序 质量 的 指标 ， 当 Q2029096. Q30z80 %， 表 明 测 序数 据 质量 较 好 。 
1.3.3 污染 评估 

所 测 物种 基因 组 DNA 样品 ， 如 果 存 在 污染 ， 不 仅 会 降低 有 效 数 据 量 ， 还 会 影响 基因 组 
Survey 分 析 结 果 的 准确 性 ， 所 测 物种 基因 组 评估 结果 将 会 呈现 误差 ， 导 致 基因 组 组 装 策略 
出 现 偏差 ， 影 响 后 续 基 因 组 的 组 装 效果 〈 赵 乐 等 , 2020) 。 
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为 了 判断 提取 的 太行 萄 、 长 裂 太行 菊 的 基因 组 DNA. 是 否 受 到 污染 ， 从 过 滤 后 的 高 质量 
clean reads 数据 中 随机 抽取 10 000 条 reads, 用 Blast 软件 比 对 NCBI 核 苷 酸 数 据 库 CNT JÆ), 
如 果 是 同 源 比 对 ， 则 认为 样本 不 存在 外 源 污染 。 
1.3.4 基因 组 特征 预 估 

为 了 对 基因 组 大 小 有 个 大 致 判断 , 用 K-mer 法 进行 (Liu etal., 2013; Chen et al., 2015). 
以 每 个 K-mer 深度 (depth) 为 横 坐 标 ，K-mer ME (frequency) 为 纵 坐 标 ， 绘 制 K-mer 深 
度 频 度 分 布 图 ， 根 据 曲线 估计 K-mer 的 深度 值 ， 对 基因 组 大 小 进行 估 测 。 从 测序 数据 中 提 
取出 的 长 度 ， 视 为 K-mer 的 寡 聚 核 昔 酸 序列 ， 对 太行 菊 、 长 裂 太行 菊 预 测序 列 有 效 数 据 进 
行 K=17 分 析 ， 根 据 公 式 : 基因 组 大 小 = 总 碱 基数 / 平均 测序 深度 = 总 Kmer 数 / 平均 
K-mer 深度 ， 计 算 基因 组 大 小 〈 霍 恺 森 等 , 2018; 赵 乐 等 , 2020) 。 
通过 贝 叶 斯 模型 ， 根 据 K-mer 的 频率 数 和 深度 值 ， 通 过 迭代 修正 所 测 物种 基因 组 的 杂 
合 度 和 重复 序列 。 根 据 杂 合 种 类 数 百 分 比 、 纯 合 种 类 数 百 分 比 、 所 有 种 类 数 ， 计 算 太 行 菊 、 
长 裂 太 行 菊 的 杂 合 度 。 同时, 计算 标准 泊 松 分 布 及 实际 数据 曲线 峰值 后 的 面积 差 . 计算 两 物 
种 基因 组 重复 序列 的 百分比 。 
1.3.5 基因 组 组 装 

运用 Soapdenovo 软件 (Vurture et al., 2017) ， 对 太行 菊 、 长 裂 太行 菊 的 clean reads 有 
效 序列 进行 拼接 ， 用 K=41 组 装 到 contig 和 scaffold. 将 组 装 好 的 基因 组 序列 与 raw reads 进 
行 比 对 ， 分 析 组 装 序列 的 GC 含量 、contig 覆盖 深度 、 长 度 和 数量 分 布 。 

根据 基因 组 测序 序列 GC depth 的 分 布 图 , 分 析 两 物种 测序 序列 是 否 有 明显 的 GC 偏向 。 
一 般 高 GC ERIR GC 区 域 ， 测 序 深度 与 正常 区 域 会 存在 较 大 差异 ， 履 盖 度 较 低 。 本 研究 中 ， 
以 10 kb TEZKO, WERIT KARIT RE AHH GC 含量 。 
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2. 流 式 细 胞 法 估 测 太行 菊 、 长 裂 太行 菊 基因 组 大 小 
对 玉米 、 太 行 菊 、 长 裂 太行 菊 单 独 测 定 ， 首 先 检测 每 个 样品 的 相对 欧 光 强度 〈 图 1: 
A-C) ， 结 果 显 示 ， 玉 米 、 太 行 菊 、 长 裂 太行 菊 样品 基因 组 DNA 相对 效 光 强度 的 峰值 分 别 
为 38、56、41。 玉 米 与 太行 菊 混 合 样品 基因 组 DNA 相对 荧光 强度 的 峰值 在 40 左右 (图 1: 
DO ， 玉 米 与 长 裂 太 行 菊 混合 样品 相对 效 光 强度 的 峰值 同样 在 40 左右 (图 1: EO 。 根 据 流 

式 细胞 结果 ， 太 行 菊 基 因 组 大 小 估算 为 2.1 Gb， 长 裂 太行 菊 基 因 组 大 小 约 为 2.4 Gb. 
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M1. Marker; A. 玉米 单独 样品 ，B. 太行 菊 单 独 样品 ，C. 长 裂 太行 菊 单 独 样品 ，D. 太行 菊 与 玉米 混合 
Fh. E. 长 裂 太行 菊 与 玉米 混合 样品 。 
MI. Marker; A. Maize samples; B. O. taihangensis samples; C. O. longilobus samples; D. Mixed samples of O. 


taihangensis and maize; E. Mixed samples of O. longilobus and maize. 


图 1 流 式 细胞 法 检测 结果 
Fig. 1 Flow cytometry of Opisthopappus taihangensis and O. longilobus 


2.2 Survey 分 析 太 行 菊 、 长 裂 太行 菊 基因 组 大 小 
2.2.1 测序 产量 统计 


通过 文库 构建 ， 太 行 菊 产 出 原始 数据 为 99.94 Mb， 过 滤 后 高 质量 数据 22.67 Mb: 
长 有 裂 太行 菊 原 始 数据 109.74 Mb， 过 滤 后 高 质量 数据 80.49 Mb。 不 论 太 行 菊 还 是 长 裂 太 
行 菊 ， 测 序数 据 Q20 E 97.42 % 以 上 ，Q30 均 为 92.53 % 以 上 ,测序 错误 率 0.04% CIE 
常 范 围 为 <0.05 %) ， 表 明 测 序 质量 较 好 ， 可 进行 进一步 的 后 续 分 析 。 
2.2.2 样品 污染 评估 

10 000 条 随机 抽取 的 clean reads 在 NT 库 中 进行 同 源 比 对 ， 发 现 太 行 菊 比 对 到 


Artemisia frigida. Chrysanthemum indicum. Helianthus maximiliani. Chrysanthemum x 


分 别 占 比 对 上 NT JÆ reads 数 的 1.56 96.0.72 96. 0.54%., 0.27 %。 长 裂 太 行 菊 比 对 到 上 
述 四 个 物种 分 别 占 比 对 上 NT Æ reads 数 的 1.09 %、0.48 9o. 0.31 %、 0.09 96. A. frigida ~ 
C. indicum 与 太行 菊 、 长 裂 太行 菊 同 属于 菊 亚 族 ， 但 与 4. frigida 亲缘 关系 更 近 ， 比 对 所 
占 比例 较 高 。 由 于 太行 菊 、 长 裂 太行 菊 基 因 组 信息 未 知 ， 在 NT 库 中 基因 注释 极 少 ， 所 
以 与 其 它 物种 比 对 比例 较 低 。 

另外 ， 比 对 结果 中 未 发 现 动 物 、 微 生物 等 异常 比 对 ， 表 明太 行 菊 、 长 裂 太 行 菊 基因 
组 DNA 样品 测序 数据 没有 污染 ， 可 用 于 Survey 分 析 。 
2.2.3 基因 组 大 小 估计 
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在 图 2 中 ， 太 行 菊 、 长 裂 太 行 菊 的 K=17 曲线 具有 严重 拖 尾 ， 暗 示 都 有 很 高 的 重复 
序列 比例 。 在 depth=28 附近 ， 出 现 太 行 菊 主峰 值 ， 由 公式 Kmer-number / depth 计算 得 
到 太行 菊 基 因 组 大 小 为 3.15 Gb 左右 , 修正 后 基因 组 大 小 为 3.13 Gb, 基因 组 的 杂 合 率 为 
0.99 %， 重 复 序列 比例 为 84.35% ( 表 1) ; depth=26 时 出 现 长 裂 太 行 菊 的 主峰 值 ， 基 因 
组 大 小 为 3.20 Gb 左右 ， 修 正 后 的 基因 组 大 小 3.18 Gb， 基 因 组 杂 合 率 1.17 %， 重 复 序 
列 比例 83.83% (R1) 。 由 此 可 知 ， 太 行 菊 属 太行 菊 与 长 裂 太 行 菊 都 为 高 重复 、 杂 合 
基因 组 。 
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A. 太行 菊 ; B. 长 裂 太 行 菊 。 
A. O. taihangensis; B. O. longilobus. 
图 2 太行 菊 、 长 裂 太 行 菊 的 Kmer 分 布 曲线 
Fig. 2 K-mer distribution curve of Opisthopappus taihangensis and O. longilobus 
表 1 太行 菊 、 长 裂 太 行 菊 K-mer 分 析 数 据 统计 
Table 1 K-mer analysis data of Opisthopappus taihangensis and O. longilobus 


物种 Species K-mer 总 数 — K-mer ”基因 组 大 ”修正 后 基 ” Ae (90) 重复 序列 GC 


量 深度 小 (Gb) 组 大 小 Heterozygous 比例 (Co) Œ 
K-mer total K-mer Genome (Gb) Repeat (96) 
number depth size Revised sequence | GC 
genome ratio content 
size 
太行 菊 94473837553 30 3.15 3.13 0.99 84.35 36.56 


Opisthopappus 

taihangensis 

TFAUK1ITAS 89639775705 28 3.20 3.18 1.17 83.83 36.63 
O. longilobus 


2.2.4 基因 初步 组 装 结果 


在 太行 菊 中 ， 共 得 到 4 148 869 条 contigs， 序 列 总 长 为 1.19 Mb, Contig N50 长 度 
445 bp,N90 114 bp, 最 长 序列 长 度 为 24 674 bp, 进一步 组 装 后 得 到 3 885 802 条 scaffolds， 
总 长 1.22 Mb， 最 长 序列 长 度 为 24 674 bp，Scaffold N50 7j 510 bp, N90 118 bp ( 表 2) 。 
长 裂 太行 菊 中 , 共有 4 776 945 条 contigs, 序列 总 长 为 1.30 Mb, Contig N50 K/Æ 408 bp, 
N90 113 bp， 最 长 序列 长 度 为 24 198 bp,， 进 一 步 组 装 后 4 453 317 条 scaffolds, 总 长 1.34 
Mb， 最 长 序列 长 度 为 24 198 bp，Scaffold N50 为 477bp，N90 116bp 〈 表 2) 。 其 中 ， 


Contig N50 和 Scaffold N50 的 长 度 较 短 ， 可 能 是 由 于 两 个 物种 
上 所 致 。 从 图 3 中 ， 可 以 看 出 明显 的 峰 ， 主 峰 前 的 峰 为 杂 


基因 组 为 复杂 基因 组 。 


不 论 是 太行 菊 还 是 长 袭 太行 


j 


因 组 杂 合 率 在 0.99 % 以 


合 峰 ， 主 峰 后 的 峰 为 重复 峰 。 


菊 ， 峰 值 在 20 和 左右 时 的 峰值 为 纯 合 峰 ， 初 步 判 断 两 物种 


表 2 太行 菊 、 长 裂 太 行 菊 基 因 组 组 装 统计 


Table 2 Genome assembly of Opisthopappus taihangensis and O. longilobus 


物种 Species 项 目 Item Contig Scaffold 
总 长 度 Total length (Mb) 1.19 1.22 
总 数量 Total number 4 148 869 3 885 802 
太行 菊 - ds 
最 大 长 度 Max length (bp) 24674 24674 
Opisthopappus taihangensis E 
N50 KÆ N50 length (bp) 445 510 
N90 长 度 N90 length (bp) 114 118 
总 长 度 Total length (Mb) 1.30 1.34 
"A 总 数量 Total number 4 716 945 4 453 317 
KAKTA ipid 
最 大 长 度 Max length (bp) 24198 24198 
O. longilobus B 
N50 长 度 N50 length (bp) 408 477 


N90 长 度 N90 length (bp) 


113 


116 
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A. 太行 菊 Contig 覆盖 深度 、 数 量 分 布 图 ，B. 长 裂 太 行 菊 Contig 覆盖 深度 和 长 度 、 数 量 分 布 图 。A. 


Contig coverage depth, length and quantity distribution of O. taihangensis; B. Contig coverage depth, length and 


quantity distribution of O. longilobus. 


图 3 Contig 分 布 图 


Fig. 3 Contig distribution 


22.5 GC 含量 及 分 布 情况 


太行 菊 属 两 物种 中 , 窗口 的 GC 含量 几乎 全 部 处 于 20~60 % 之 间 , 并 主要 集中 在 30 % 
左右 ， 其 中 太行 菊 GC 含量 为 36.56 %， 长 裂 太 行 菊 为 36.63 96 R1) 。 两 物种 样品 不 
存在 明显 异常 ，GC 含量 没有 明显 偏向 ，GC depth 深度 的 分 布 可 分 为 三 层 : 高 中 低 深 度 
3 个 区 域 (图 4) 。 中 深度 区 域 大 约 为 高 深度 区 域 的 50 % 左 右 ， 可 能 与 太行 菊 、 长 裂 太 


行 菊 一 定 的 杂 合 有 关 。 在 组 装 过 程 中 ， 灯 合 
引起 GC 含量 出 现 分 层 现象 。 


可 能 会 导致 同 源 染色 体 杂 合 部 位 单条 组 装 ， 
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A. 太行 菊 ;，B. 长 裂 太 行 菊 。 
A. O. taihangensis; B. O. longilobus. 


图 4 Contig GC $ &RIU stt RE 
Fig. 4 GC content and depth of coverage 


3 讨论 

本 研究 通过 流 式 细胞 法 和 高 通 量 测序 K-mer 法 初步 调查 了 菊 科 崖 壁 植物 太行 菊 、 长 
裂 太 行 菊 的 基因 组 大 小 、 杂 合 率 和 GC 含量 等 特征 《〈 宋 立 肖 等 , 2018) 。 太 行 菊 、 长 裂 
太行 菊 基 因 组 初步 估算 大 小 分 别 为 2.1 Gb 和 2.4 Gb; 修 正 后 ,基因 组 大 小 分 别 为 3.13 Gb, 
3.18 Gb. 

目前 公布 的 菊 科 植物 中 ， 最 小 的 基因 组 为 管状 花 亚 科 紫苑 族 (Astereae) WINES, 
其 基因 组 只 有 335 Mb (Peng et al., 2014) ， 最 大 的 是 春 黄菊 族 CAnthemideae) 植物 ， 
基因 组 约 为 138.88 Gb (Garcia et al., 2013) 。 与 太行 菊 、 长 裂 太 行 菊 亲缘 关系 较 近 的 青 
蒿 、 野 菊 ， 基 因 组 大 小 分 别 为 1.74 Gb (Shen et al., 2018) 和 3.07 Gb (Song et al., 2018). 
太行 菊 属 太行 菊 、 长 裂 太行 菊 基 因 组 大 小 符合 菊 科 植物 的 基因 组 特征 〈Garcia et al., 
2013) 。 物 种 的 进化 与 DNA 含量 之 间 的 关系 是 复杂 的 ， 基 因 组 越 大 的 物种 ， 其 濒危 程 
度 越 高 (Vinogradov, 2003) 。 相 对 于 野 菊 、 青 芒 等 ， 太 行 菊 、 长 裂 太行 菊 生长 在 相对 
恶劣 的 崖 壁 环境 下 ， 已 被 列 为 国家 二 级 濒危 物种 。 

本 研究 中 ， 流 式 细胞 法 估 测 结果 比 K-mer 分 析 法 的 结果 小 大 约 1 Gb。 流 式 细胞 法 
估 测 太行 菊 、 长 裂 太行 菊 基 因 组 较 小 ,可 能 与 选择 基因 组 较 小 的 玉米 为 对 照样 品 (2.3 Gb) 
AK, 而 K-mer 分 析 基 因 组 法 是 基于 数学 计算 可 能 更 全 面 准 确 (Dole;el et al., 2007; Wang 
et al., 2018) 。 在野 菊 基 因 组 分 析 中 , 流 式 细胞 法 估 测 的 结果 大 于 K-mer 分 析 结 果 (Song 
etal., 2018) ， 而 其 它 植物 的 基因 组 调查 ， 两 种 方法 估 测 的 结果 也 不 完全 一 致 ， 如 甘 暮 


属 的 马 通 蕨 〈Zpomoea pes-caprae) (TERE, 2019) 、 绣 球 属 的 绣球 (Hydrangea 
macrophylla) 《〈 陈 双双 等 , 2021) 

在 已 释放 的 植物 基因 组 中 ，GC 含量 大 多 在 30-47 %〔 邓 果 特 等 , 2013; 宋 立 肖 等 ， 
2019; 于 福来 等 , 2019) 。 太 行 菊 、 长 裂 太 行 菊 基因 组 GC 含量 分 别 为 36.56 % 和 36.63 %。 
同属 管状 花 亚 科 的 刺 苞 菜 葡 基 因 组 GC 含量 为 32 % (Scaglione et al, 2016) , $$$ 
GC 含量 31.5 % (Shen et al., 2018) , IHX 37.2 % (Song et al., 2018) 。 太 行 菊 、 长 裂 
太行 菊 基 因 组 GC 含量 在 所 释放 的 植物 基因 组 GC 含量 范围 之 内 。 

根据 基因 组 杂 合 度 大 小 ， 基 因 组 分 为 微 杂 合 基因 组 0.5% SREK <0.8 %) 、 
高 杂 合 基因 组 ( 杂 合 率 Lm 0890 和 高 重复 基因 组 (重复 序列 比例 => 50 %) Cni 
芳 等 , 2014; 周 佳 烟 等 ,2017;， 王 雪 等 , 2018) 。 太 行 菊 、 长 裂 太 行 菊 基 因 组 杂 合 率 分 别 
为 0.99 % 和 1.17 %， 重 复 序列 比例 分 别 为 84.35 % 和 83.83 %。 植 物 基因 组 杂 合 受 繁殖 
方式 影响 , 一 般 具 有 自 花 授粉 繁育 方式 的 物种 的 杂 合 度 低 于 异 花 授 粉 植物 ( 王 雪 等 , 2018; 
都 明理 等 , 2019) 。 太 行 菊 、 长 裂 太 行 菊 自 交 不 亲 和 “【〈 胡 氮 和 赵 恩 惠 , 2008) ， 可 进行 有 
性 生殖 形成 种 子 ， 也 可 在 茎 节 处 长 出 新 的 枝条 ， 即 有 性 繁殖 和 无 性 繁殖 并 存 ， 这 种 繁育 
方式 使 得 太行 菊 、 长 有 裂 太行 菊 基 因 组 存在 一 定 的 杂 合 率 。 青 艾 基 因 组 的 杂 合 率 在 
1.0-1.5 % 之 间 ， 重 复 序列 比例 61.57% CShenetal,2018) ; 野 菊 基 因 组 也 呈现 出 高 的 
杂 合 率 且 重复 序列 为 69.6 % (Song etal., 2018) 。 具 有 高 比例 的 重复 序列 是 菊 科 已 公布 
的 大 基因 组 物种 (3 Gb) 的 共有 特征 〈Garcia et al., 2013) 。 这 些 高 比例 的 重复 序列 在 
一 定 程 度 上 加 大 了 太行 菊 、 长 裂 太 行 菊 的 基因 组 。 

综 上 ， 从 基因 组 基本 结构 特征 看 ， 太 行 菊 和 长 裂 太行 菊 基 因 组 都 属于 高 重复 、 高 杂 
合 、 大 基因 组 的 复杂 基因 组 。 

另外 ， 采 用 K-mer = 41 进行 基因 组 初步 组 装 ， 太 行 菊 Contig N50 73 445 bp， 进 一 
步 组 装 后 Scaffold N50 7y 510 bp， 最 长 序列 长 度 为 24 674 bp。 长 裂 太 行 菊 Contig N50 
长 度 408 bp， 进 一 步 组 装 后 Scaffold N50 为 477bp， 最 长 序列 长 度 为 24 198 bp。 根据 两 
物种 基因 组 的 调查 分 析 , 建议 后 续 研 究 采用 第 二 代 和 第 三 代 测 序 技术 相 结合 , 对 太行 菊 、 
长 裂 太 行 菊 基因 组 进行 测序 和 组 装 ， 同 时 ， 辅 以 H-C， 进 行 染色 体 水 平 组 装 ， 以 期 获得 
两 物种 高 质量 的 全 基因 组 图 谱 。 

本 研究 获得 的 太行 菊 属 太行 菊 、 长 裂 太 行 菊 基 因 组 大 小 、 特 征 等 信息 ， 为 以 后 绘 于 
两 物种 基因 组 的 精细 图 谱 黄 定 了 基础 ， 也 为 研究 利用 菊 科 野生 种 质 资 源 提供 了 参考 ( 赵 
乐 等 , 2020)。 
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